ECCV2022|一种基于先验指导的对抗样本初始化方法

作者：每天吃的饱饱的 | 来源：互联网 | 2023-08-11 08:26

点击下方卡片，关注“CVer”公众号AICV重磅干货，第一时间送达点击进入—CV微信技术交流群中科院信工所中山大学操晓春教授课题组，香港

点击下方卡片&＃xff0c;关注“CVer”公众号
AI/CV重磅干货&＃xff0c;第一时间送达
点击进入—>CV微信技术交流群
中科院信工所/中山大学操晓春教授课题组&＃xff0c;香港中文大学(深圳)吴保元教授课题组&＃xff0c;腾讯AI Lab共同提出的一种基于先验指导的对抗样本初始化方法已被ECCV2022接收。对抗训练是抵御对抗样本攻击最有效的方法之一。标准的对抗训练往往使用多步的方法来生成对抗样本&＃xff0c;如PGD。然而&＃xff0c;这需要花费大量时间来计算梯度。为了提高对抗训练的效率&＃xff0c;快速对抗训练&＃xff08;FAT&＃xff09;应运而生。但FAT往往存在灾难性遗忘的问题&＃xff0c;例如在FAT中后段&＃xff0c;训练模型在对抗攻击下的鲁棒准确率会突然急剧下降。针对这个问题&＃xff0c;本文通过比较标准对抗训练与FAT的训练过程&＃xff0c;发现导致FAT出现灾难性遗忘的原因是FAT中产生的对抗样本&＃xff08;AEs&＃xff09;的攻击成功率在训练中逐渐变低。作者通过提出一种基于先验指导的&＃xff08;Prior-Guided&＃xff09;对抗样本初始化方法来解决FAT中的灾难性遗忘的问题&＃xff0c;从而提升FAT的效果。

论文标题: Prior-Guided Adversarial Initialization for Fast Adversarial Training
收录会议: ECCV 2022
论文链接: https://arxiv.org/pdf/2207.08859.pdf
代码链接:https://github.com/jiaxiaojunQAQ/FGSM-PGI

1. 问题背景

传统的对抗训练可以归类为一个最小最大化优化问题&＃xff1a;

其中表示参数为的模型&＃xff0c;为损失函数&＃xff0c;表示在输入空间上添加的对抗扰动&＃xff0c;其大小可以被限制。从而多步的对抗攻击方法可以被定义为&＃xff1a;

其中表示在第次迭代时的扰动&＃xff0c;表示攻击步长&＃xff0c;为将输入影射到的投影。

尽管多步的对抗训练方法可以有效提高模型的鲁棒性&＃xff0c;但这往往需要大量时间和计算资源来生成训练中的对抗样本。随后&＃xff0c;快速对抗训练通过单步快速梯度符号&＃xff08;FGSM&＃xff09;的方法被提出用以提升生成对抗样本的效率&＃xff1a;

其中是最大扰动强度。尽管基于FGSM的对抗训练方法起到了较好的加速效果&＃xff0c;但是具有灾难性遗忘的问题&＃xff0c;即在使用基于FGSM的方法对抗训练一段时间后&＃xff0c;训练模型的鲁棒性会迅速消失&＃xff0c;无法抵御PGD所产生的对抗样本的攻击。Wong等人提出了在基于FGSM的对抗样本生成中加入随机初始化&＃xff0c;即

其中表示随机初始化&＃xff0c;是一个高斯分布。而Andriushchenko等人的工作表明生成对抗样本时添加随机初始化并不能防止灾难性遗忘的发生。

2. 基本先验指导的对抗初始化

2.1 审视灾难性遗忘

对抗训练的灾难性遗忘是指在快速对抗训练中后期模型的鲁棒准确率突然降低到的现象&＃xff0c;如下图右所示

这种现象最先由Wong等人发现&＃xff0c;随后他们又发现使用FGSM生成对抗样本时使用随机初始化可以延缓灾难性遗忘发生的时间&＃xff0c;但是随着训练的进行&＃xff0c;灾难性遗忘还是无法避免。

为了研究灾难性遗忘发生的原因&＃xff0c;本文首先对基于PGD的标准对抗训练&＃xff08;SAT&＃xff09;以及基于FGSM的快速对抗训练&＃xff08;FAT&＃xff09;中途所生成的对抗样本进行比较和研究。通过观察上图左&＃xff0c;本文发现&＃xff1a;&＃xff08;1&＃xff09;由标准的FGSM-AT与添加随机初始化的FGSM-RS生成的对抗样本的攻击成功率&＃xff08;ASR&＃xff09;分别在第20个和第74个epoch降低到&＃xff0c;从而导致了灾难性遗忘的发生。这预示着如果对抗训练途中生成的对抗样本丧失了攻击性&＃xff0c;则模型的鲁棒性会迅速降低&＃xff1b;&＃xff08;2&＃xff09;通过比较FGSM-AT与FGSM-RS发现加入随机初始化可以延缓灾难性遗忘的发生&＃xff0c;但是无法避免&＃xff1b;&＃xff08;3&＃xff09;PGD-2-AT中没有发生灾难性遗忘。由于PGD-2-AT可以认为是带有对抗初始化&＃xff08;adversarial initialization&＃xff09;的FSGM&＃xff0c;因此对抗初始化可以提高所生成的对抗样本的质量&＃xff0c;尽管进行对抗初始化需要额外的梯度计算。

2.2 基于先验指导的对抗初始化

通过上述观察&＃xff0c;本文作者转而思考如何有效的得到对抗初始化而不需要额外的计算开销。作者提出可以使用训练过程中的历史对抗扰动&＃xff0c;来作为当前时刻的初始化。而这种历史对抗扰动可以认为是不需要进行额外计算就能得到的先验知识。本文探索了三种利用历史对抗扰动的策略&＃xff0c;即&＃xff08;1&＃xff09;先前batch生成的扰动&＃xff1b;&＃xff08;2&＃xff09;先前epoch生成的扰动&＃xff1b;&＃xff08;3&＃xff09;所有epoch产生的扰动的动量&＃xff0c;分别命名为FGSM-BP&＃xff0c;FGSM-EP和FGSM-MEP。

Prior From the Previous Batch (FGSM-BP): 将上一个batch所生成的对抗扰动存储下来作为当前batch生成对抗样本时的初始化&＃xff0c;公式如下&＃xff1a;

其中代表第个batch所添加的对抗扰动。

Prior From the Previous Epoch (FGSM-EP): 将上一个epoch所生成的对抗扰动存储下来作为当前epoch生成对抗样本时的初始化&＃xff0c;公式如下&＃xff1a;

其中代表第个epoch所添加的对抗扰动。

Prior From the Momentum of All Previous Epochs (FGSM-MEP): 为了充分利用整个训练过程中的历史对抗扰动信息&＃xff0c;作者提出使用使用先前所有training epoch中所生成的扰动的动量来作为当前epoch生成对抗样本时的初始化&＃xff0c;公式如下&＃xff1a;

2.3 Prior-guided Initialization based Regularization

本文还提出了一种基于先验指导初始化的正则化方法来提升模型的鲁棒性。给定先验指导下的初始化&＃xff0c;FGSM可以产生当前时刻的对抗扰动。不论是先验指导下的初始化还是当前时刻的扰动都可以用来生成对抗样本。因此迫使这两种方式生成的对抗样本具有相同的输出结果有助于提升所学模型函数的光滑性。所提出的正则项可以加入到训练损失中去来更新模型参数&＃xff0c;如下所示&＃xff1a;

其中代表上述三种方法之一所生成的先验指导的初始化&＃xff0c;代表FGSM使用作为初始化所生成的对抗扰动&＃xff0c;是一个常系数项。上述公式中第一项为对抗样本上的交叉熵损失&＃xff0c;第二项为与 d的输出之差的距离。第二项的目的是使得学到的模型不仅对当前生成的对抗样本鲁棒&＃xff0c;而且对历史的对抗样本也鲁棒。这样&＃xff0c;所提出的正则项显式的迫使模型函数在样本周围更加光滑&＃xff0c;从而提升模型鲁棒性。

2.4 理论分析

由于在非凸优化问题中梯度的范数与收敛性有关&＃xff0c;因此更小的对抗扰动的范数上界有助于对抗训练更快地收敛到局部最小值。本文给出了基于先验指导初始化所生成的对抗扰动的范数上界&＃xff0c;即&＃xff0c;如下图所示&＃xff0c;这比FGSM-RS提出的更小。

3. 实验

3.1 实验设置

本文共使用ResNet-18&＃xff0c;WideResNet34-10在CIFAR-10和CIFAR-100上&＃xff0c;PreActResNet18在Tiny ImageNet上&＃xff0c;以及ResNet-50在ImageNet上评估所提方法的有效性。

CIFAR-10结果

CIFAR-100结果

Tiny ImageNet结果

ImageNet结果

消融实验

为了验证所提出的基于经验指导的正则化方法的有效性&＃xff0c;本文使用ResNet18在CIFAR-10上进行了消融实验&＃xff0c;结果如下。

4. 总结

在本文中&＃xff0c;我们从初始化的角度研究了如何提高对抗样本的质量&＃xff0c;并提出采用历史生成的对抗扰动来初始化对抗样本。它可以在没有额外计算成本的情况下生成有效的对抗样本。此外&＃xff0c;我们还提出了一种简单而有效的正则化方法提高模型的鲁棒性&＃xff0c;从而防止当前扰动与先验引导的初始化偏差太大。正则化项利用历史和当前的对抗性扰动来指导模型学习。广泛的实验评估表明&＃xff0c;所提出的方法可以防止灾难性的过度拟合&＃xff0c;并以较低的计算成本优于最先进的FAT 方法。

点击进入—>CV微信技术交流群

CVPR/ECCV 2022论文和代码下载

后台回复&＃xff1a;CVPR2022&＃xff0c;即可下载CVPR 2022论文和代码开源的论文合集

后台回复&＃xff1a;ECCV2022&＃xff0c;即可下载ECCV 2022论文和代码开源的论文合集

后台回复&＃xff1a;Transformer综述&＃xff0c;即可下载最新的3篇Transformer综述PDF

目标检测和Transformer交流群成立扫描下方二维码&＃xff0c;或者添加微信&＃xff1a;CVer222&＃xff0c;即可添加CVer小助手微信&＃xff0c;便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖&＃xff1a;目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。一定要备注&＃xff1a;研究方向&＃43;地点&＃43;学校/公司&＃43;昵称&＃xff08;如目标检测或者Transformer&＃43;上海&＃43;上交&＃43;卡卡&＃xff09;&＃xff0c;根据格式备注&＃xff0c;可更快被通过且邀请进群▲扫码或加微信号: CVer222&＃xff0c;进交流群 CVer学术交流群&＃xff08;知识星球&＃xff09;来了&＃xff01;想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料&＃xff0c;欢迎扫描下方二维码&＃xff0c;加入CVer学术交流群&＃xff0c;已汇集数千人&＃xff01;▲扫码进群 ▲点击上方卡片&＃xff0c;关注CVer公众号

整理不易&＃xff0c;请点赞和在看

推荐阅读

input
CBAM:卷积块注意模块

CBAM:ConvolutionalBlockAttentionModule论文地址：https:arxiv.orgabs1807.06521简介：我们提出了 ... [详细]

蜡笔小新 2024-10-10 20:39:05
io
人脸识别中的损失函数

本文主要是针对人脸识别中的各种loss进行总结。背景对于分类问题，我们常用的lossfunction是softmax，表示为：,当然有softmax肯定也有hardmax:，so ... [详细]

蜡笔小新 2024-10-08 18:21:04
数组
浅析python实现布隆过滤器及Redis中的缓存穿透原理_python

本文带你了解了位图的实现，布隆过滤器的原理及Python中的使用，以及布隆过滤器如何应对Redis中的缓存穿透，相信你对布隆过滤 ... [详细]

蜡笔小新 2024-11-13 16:43:07
java
秒建一个后台管理系统？用这5个开源免费的Java项目就够了

秒建一个后台管理系统？用这5个开源免费的Java项目就够了 ... [详细]

蜡笔小新 2024-11-12 03:21:33
window
精选Linux经典著作在数字图书馆展出

数字图书馆近期展出了一批精选的Linux经典著作，这些书籍虽然部分较为陈旧，但依然具有重要的参考价值。如需转载相关内容，请务必注明来源：小文论坛（http://www.xiaowenbbs.com）。 ... [详细]

蜡笔小新 2024-11-08 10:55:29
window
Vue.js 前端框架中使用 vuei18n 实现多语言支持的详细指南

本文详细介绍了在 Vue.js 前端框架中集成 vue-i18n 插件以实现多语言支持的方法。通过具体的配置步骤和示例代码，帮助开发者快速掌握如何在项目中实现国际化功能，提升用户体验。同时，文章还探讨了常见的多语言切换问题及解决方案，为开发人员提供了实用的参考。 ... [详细]

蜡笔小新 2024-11-05 20:00:42
io
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
io
Intel IA-32 架构软件开发人员手册详尽指南

《Intel IA-32 架构软件开发人员手册详尽指南》提供了详尽的 IA-32 架构技术文档，涵盖指令集、系统编程和硬件接口等内容，为软件开发人员提供全面的技术支持和参考。该手册不仅包括详细的架构说明，还提供了丰富的编程示例和最佳实践，帮助开发人员更好地理解和应用 IA-32 架构。 ... [详细]

蜡笔小新 2024-11-05 10:04:03
io
Python AlphaShape：基于点集估算图像区域的Alpha形状算法解析

本文探讨了基于点集估算图像区域的Alpha形状算法在Python中的应用。通过改进传统的Delaunay三角剖分方法，该算法能够生成更加灵活和精确的形状轮廓，避免了单纯使用Delaunay三角剖分时可能出现的过大三角形问题。这种“模糊Delaunay三角剖分”技术不仅提高了形状的准确性，还增强了对复杂图像区域的适应能力。 ... [详细]

蜡笔小新 2024-11-03 17:11:41
search
语义、实例与全景分割的对比分析（Comparative Analysis of Semantic, Instance, and Panoptic Segmentation）

图像分割技术在人工智能领域中扮演着关键角色，其中语义分割、实例分割和全景分割是三种主要的方法。本文对这三种分割技术进行了详细的对比分析，探讨了它们在不同应用场景中的优缺点和适用范围，为研究人员和从业者提供了有价值的参考。 ... [详细]

蜡笔小新 2024-10-29 18:51:14
search
基于TextBoxes++与RetinaNet的高效开源OCR文本识别模型

本文介绍了一款高效的开源OCR文本识别模型，结合了TextBoxes++和RetinaNet的优势。该模型在文本检测方面表现出色，适用于多种场景。项目代码已托管至GitHub，方便研究人员和开发者使用和改进。 ... [详细]

蜡笔小新 2024-10-26 16:12:00
io
在\ n \ n \ n \ n之间的文本中修剪图案 - Trim pattern in a text between \n\n\n\n

IamcleaningtextinR.Mytexthastheform我在R中清理文本。我的文字有表格buthecouldnotavoidthesubje ... [详细]

蜡笔小新 2024-10-21 18:22:11
java
5.Numpy 索引(一维索引/二维索引)

本文内容是根据莫烦Python网站的视频整理的笔记，笔记中对代码的注释更加清晰明了,同时根据所有笔记还整理了精简版的思维导图,可在此专栏查看,想观看视频可直接去他的网 ... [详细]

蜡笔小新 2024-10-19 13:29:11
java
办公百宝箱——PDF、格式转换、图片处理、屏幕录制

1.软件介绍万彩办公大师包含了60多个全部免费、无广告、无插件的办公小工具，几乎可以满足各种办公需求，如PDF工具集、文档音视频图片转换工具集、文字识 ... [详细]

蜡笔小新 2024-10-18 10:08:10
java
跪服！大四学生开发了一整套文言编程

机器之心报道参与：思、Jamin用文言文写的官方编程教程《文言陰符》，类似pip那样的包管理工具「文淵閣」，还有文言编程开源IDE「文言齋 ... [详细]

蜡笔小新 2024-09-27 20:11:29

每天吃的饱饱的

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章